iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 4
1

繼前一天,我們繼續來看看 BIOS 常見的問題

釐清問題 --- ACPI 是啥?

  • 進階組態與電源介面(英文:Advanced Configuration and Power Interface,縮寫:ACPI),是1997年由英特爾、微軟、東芝公司共同提出、制定提供作業系統應用程式管理所有電源管理埠,是一種工業標準,包括了軟體和硬體方面的規範^11
    • 換句話說,這又是一個 UEFI 社群的新規章,他定義了一些特殊的電源使用方式,例如下面這些功能^12:
      1. 用戶可以使外設在指定時間開關。
      2. 使用筆記本電腦的用戶可以指定電腦在低電壓的情況下進入 低功耗狀態,以保證重要的應用程式運行。
      3. 作業系統可以在應用程式對時間要求不高的情況下降低時鐘頻率。
      4. 作業系統可以根據外設和主板的具體需求為它分配能源。
      5. 在無人使用電腦時可以使電腦進入休眠狀態,但保證一些通 信設備打開。
      6. 即插即用設備在插入時能夠由ACPI來控制。
  • 問題的發生
    • Ubuntu 18.04 沒有原裝 Nvidia 顯卡的圖形驅動,導致無法正確透過 ACPI 調用電源管理而出錯。^13
  • 問題的解決
    • 我們可以透過更改 GRUB2 的啟動參數來「迴避」這個問題。^14

    • 再進入選擇 Try Ubuntu 或 install Ubuntu 的頁面,在選項上按下 e ,隨後可以進入 GRUB2 的參數修改介面,在 Linux 那行,後方刪除三個 --- 後加入 acpi=off

      • 錯誤示範:acpi=off 錯誤示範
      • 正確示範:在这里插入图片描述
      • 接著在開機時,要壓住 shift ,再次進入 GRUB2 並且做相同的設定。如圖片中倒數第二行,一樣加在 Linux 那行。
        在这里插入图片描述
    • 開機後可以使用以下指令安裝 Nvidia 驅動
      sudo add-apt-repository ppa:graphics-drivers/ppa
      sudo apt-get update
      nvidia-smi 後可獲得建議安裝指令
      sudo apt-get install nvidia-381 (後面請選擇適當的或最新版本)

    • 如果仍然出現問題可以編輯 /etc/default/grub ,加入 acpi=off
      但是要注意可能發生 CPU 風散停止的問題。
      在这里插入图片描述

  • 問題補充
    • 網路上有人有遇到循環 GRUB2 而無法進入系統的情形,詳情可參考此篇:https://www.ubuntu-tw.org/modules/newbb/viewtopic.php?post_id=209042
    • 筆者建議可以安裝 Psensor 這個圖形化的軟體,在安裝完成後的一段時間,觀測硬體溫度。^15
      sudo apt-get install lm-sensors hddtemp
      sudo sensors-detect
      sensors
  1. 接著,順利進入安裝程序後後,卻發現無法正確抓到 NVME SSD。

釐清問題 --- NVME SSD

根據這篇文章把 Ubuntu 16.04 及 18.04 安裝到幾款特殊的 NVMe SSD^16 上,可以知道大概是 APST(Autonomous Power State Transitions) 的問題,可見作者在 Arch Linux Wiki 上可以找到解決方法

  • 問題的發生
    • 而問題的細節是因為 NVME 的省電模式似乎因為驅動的問題而掛了,近一步可以閱讀PMC NVMe主控动态电源管理^17理解更多有關於 NVME 電源管理代碼的問題。
  • 問題的解決
    • 在剛剛相同的頁面,相同行,空格後接續補上此參數nvme_core.default_ps_max_latency_us=5500 開機後 installer 就能偵測到 NVMe SSD 了。
      在这里插入图片描述
    • 因為 Ubuntu 預設是不會出現 GRUB 選單,會自動進入系統,所以安裝完第一次開機時要按住 shift 強制讓 GRUB 出現,再次加上 nvme_core.default_ps_max_latency_us=5500 參數開機,如果不加上還是能進系統,但會隨機遇到系統完全 hang 住無法動彈,只能強制重新開機的狀況,例如執行 lscpi uname 等指令都有可能引發。
    • 成功第一次穩定進入系統,要去編輯 /etc/default/grubnvme_core.default_ps_max_latency_us=5500 參數加上去,再執行 sudo update-grub 更新 GRUB 設定。
      在这里插入图片描述

結論

至此為止,已經成功了安裝必備的基本環境,可開始 Ubuntu 18.04 的機器學習之旅。其中我們遇到許多困難,雙系統的安裝並不容易,所以在這之後,我們將介紹一個筆者現在採用的方案 Proxmox VE 作為學生日常機器學習的解決方案


上一篇
Day 3 談傳統:Ubuntu Tensorflow-GPU 環境配置 - 1
下一篇
Day 5 雙系統轉 PVE 心路歷程
系列文
在家機器學習?用虛擬化技術實現個人 AI 環境配置30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言